Confidence Intervals, Margins of Error, and Confidence Levels in UX信心水平、誤差範圍和信心區間在使用者體驗中的應用
信心區間的計算可以提供研究指標對整個使用者群行為解釋能力的機率估計。透過信心區間,UX 研究人員可以量化研究資料的準確性,並更好地展示結果。
信心區間和誤差範圍
在使用者體驗研究中,我們通常透過樣本資料估計整個使用者群體的行為。由於無法調查所有目標使用者群,信心區間為我們提供了一個關於指標真實值的可能範圍。
定義:信心區間是整個使用者群體真實指標的可能範圍。
例如,如果一項研究顯示 79% 的加拿大成年人願意接種疫苗,且誤差範圍為 ±2.1%,這意味著實際比例可能在 77% 到 81% 之間。這一範圍即為信心區間。

誤差範圍和信心區間傳遞的資訊相同。信心區間的寬度是誤差範圍的兩倍。例如:
- 信心區間下限 = 觀測值 - 誤差範圍
- 信心區間上限 = 觀測值 + 誤差範圍
統計學為我們提供了計算信心區間的方法。雖然通常使用統計軟體或線上工具完成計算,但瞭解影響信心區間的因素仍然重要。

更窄的信心區間更理想
在量化使用者體驗研究中,較窄的信心區間提供了更多資訊。例如,如果任務的成功率為 40%,而信心區間在 0%-80% 之間,則難以解讀資料。而若信心區間縮小到 35%-45%,則可為介面可用性提供更明確的資訊。
影響信心區間寬度的三個主要因素是:
- 樣本大小:樣本越大,信心區間越窄。
- 樣本的變異性:變異性越高,信心區間越寬。
- 信心水平:信心水平越高,信心區間越寬。
置信水平
信心區間是基於機率計算的,無法保證所有計算結果都正確。然而,研究人員可以透過選擇信心水平來控制錯誤的機率。
定義:信心水平表示信心區間包含真實值的機率。
例如,若信心水平為 95%,這意味著計算的信心區間有 95% 的機率包含真實值。換句話說,如果執行 100 次研究,其中 95 次計算結果正確,5 次可能不包含真實值。

儘管科學出版物通常使用 95% 的信心水平,但在使用者體驗研究中,信心水平可以根據實際情況進行調整。例如:
- 對於關鍵任務(如飛機降落儀錶板的設計),需要高信心水平。
- 對於非關鍵任務(如機上娛樂系統的重置),可以接受較低的信心水平。
信心水平的選擇需平衡準確性與成本:
- 較高的信心水平提供更高的準確性,但會導致信心區間更寬,從而需要更大的樣本量。
- 較低的信心水平成本較低,但準確性會有所降低。
結論
信心區間是一種統計工具,用於評估研究結果對整個使用者群行為的預測能力。信心區間越窄,資訊價值越高,但通常需要更大的樣本量。
研究人員應根據任務的重要性和資源選擇合適的信心水平,從而平衡結果的準確性與研究成本。